草庐IT

Python BeautifulSoup 提取特定的 URL

全部标签

javascript - 将特定的 XML 节点拉入 HTML 文档

第一次海报。请温柔点。这个主题可能与其他几个问题类似,但据我所知,这是我试图解决的一个独特问题。FWIW,我主要是一名设计师;我对Flash、HTML和CSS很危险,但对其他所有东西都有些陌生。通过四处搜索,我似乎正在寻找一个ajax/jquery解决方案,我需要一些帮助。首先,我构建了一个相当复杂的Flash界面,它从格式正确且经过验证的XML文件中提取内容。这部分已经完成,效果很好。但是,客户希望为没有Flash的观众创建一个简单的(r)javsScript版本的界面。并且,他们希望此版本从同一个XML文件中提取值(文本),因此他们只需编辑一个文件即可进行更改。看似合理的要求,但执

python - 如何使用 ElementTree 在 XML 中查找特定元素

我正在尝试使用Python3.3.1解析从youtube视频提要中获取的XML字符串。这是代码:importreimportsysimporturllib.requestimporturllib.parseimportxml.etree.ElementTreeaselement_treedefget_video_id(video_url):returnre.search(r'watch\?v=.*',video_url).group(0)[8:]defget_video_feed(video_url):video_feed="http://gdata.youtube.com/feeds

xml - 在 R 中提取 XML 节点和属性

我有一个如下所示的XML数据集:.........-..........................'por'......................................................-..........................'por'..............................使用XML包,提取POR标签的子标签和标签属性的最干净的方法是什么?我把这个有效的拼凑在一起,但它很慢(很可能是由于xpathSApply调用)并且很难读。trackToDataFrame=function(file){doc2=xmlParse

xml - 如何使用 Perl 的 LWP 提取网站的 XML 并保存在文件中?

如何从网站(http://tv.yahoo.com/listings)中提取信息,然后从中创建XML文件?我想保存它以便稍后解析并使用JavaScript显示信息?我对Perl很陌生,我不知道该怎么做。 最佳答案 当然。最简单的方法是Web::Scraper模块。它的作用是让您定义由散列键名,定位感兴趣元素的XPath表达式,以及从中提取数据位的代码。Scraper对象获取一个URL并返回提取数据的哈希值。如果需要,每个键的提取器代码本身可以是另一个刮板对象,这样您就可以定义如何刮取重复的复合页面元素:提供XPath以在外部刮板中找

c# - 如何从 xml 文档中删除特定节点?

我有以下xml结构。我要删除一个完整的节点USDCurrencyStringUSDUSDExchangeStringUSUSTickerStringCAAPL为此,我使用以下代码-XmlDocumentdoc=newXmlDocument();doc.Load(@"C:\CASInputRequest_WOELN_Var1.xml");XmlNodeListNodeTradeType=doc.GetElementsByTagName("ColumnValues");NodeTradeType[0].RemoveAll();doc.Save(@"C:\CASInputRequest_WO

xml - 使用 XSLT 获取位置(查找特定项目后的所有节点)

我正在尝试进行这样的转换。假设我有一个XML文件:AndyEmmaJohnCindyMay现在我想选择Emma之后的所有元素元素,所以输出将是这样的:JohnCindyMay我只能通过手动声明条件来完成条件[position()>2]但是有没有办法自动获取位置呢?大概思路是这样的:[position()>Emma]或[position()>b] 最佳答案 你可以做的是/name/*[.='Emma']/following-sibling::*或/name/b/following-sibling::*。

xml - XPath - 从字符串中提取数值

thisismyvalue822880494thisismyvalue我对xpath、xml和stylevision很陌生,所以这可能是一个基本问题。我正在使用stylevision2010和xpath为模式创建sps/xslt。在上面的节点中,您可以看到节点内有一个数值,我想提取该值并将其转换为我的pdf/html中的链接。问题是我似乎无法提取它。子字符串不是一个选项,因为值的长度和其中数值的位置各不相同。有些人可能会认为模式组成不当,数值应该在单独的节点/属性中/...我对此无能为力,因为该模式是由另一家公司提供的。提前致谢! 最佳答案

xml - 从 BPEL 中的 SOAP 主体请求字符串中提取 XPath

我正在使用JDeveloper编写BPEL流程。当我尝试从我的请求xml中提取节点的值时遇到问题。请求XML如下:200degreeCelsiusdegreeFahrenheit我能够从SOAP主体中提取请求XML字符串并将其放入另一个字符串变量(比如strRequest)。我正在尝试从此strRequest变量中提取Temperature节点的值(即200)。我会将其转换为数字并将其分配给另一个double类型的变量。对于提取温度节点值的函数,我的XPath查询应该是什么?number(bpws:getVariableData('strRequest','',''))我试过了bpws

javascript - Chrome 扩展 : Unsafe attempt to load URL 中的 XSLT

我正在编写一个Chrome扩展程序,它应该将XSLT转换动态应用于某些XML文档。仅出于测试目的,我使用了以下XML和XSL文件:XML:timeoutNameserver%2520not%2520registered.Finish11111002fc0f139b88a800151e5f21b9d747919XSL::如果链接在测试XML文件本身内部,则转换工作正常,即通过:扩展应该将相同的xsl链接注入(inject)XML文件。list.json:{"permissions":["tabs",""],"content_scripts":[{"matches":[""],"js":[

html - 如何转义字符串中的特定 HTML 标记

我需要在网页中显示之前转义HTML标记的黑名单。选择性的原因是允许保留格式(正文、斜体、字体等),但不允许保留任何会“破坏”页面的标签(脚本、元等)。经过一段时间的思考,我想到了两种方法:RegEx——几乎每个人都会告诉您,使用RegEx来操纵HTML是一个坏主意HtmlAgilityPack我认为我最好的(也是唯一的)解决方案是将字符串加载到HtmlAgilityPack并递归循环遍历子节点。对于每个节点,我都会检查它是否在指定的黑名单中。如果是,我将转义打开(如果存在则关闭)节点,然后处理InnerHtml.如果它不在列表中,则按原样输出节点,同时仍在处理InnerHtml.因此,